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10 La pr^sente invention concerne un traitement num&ique difference de la voix 
et de la musique, le filtrage du bruit, la creation d'effets speciaux ainsi qu'un 
dispositif pour la mise en oeuvre dudit proc6d6. 

Elle a plus particulterement pour objet de transformer la voix d'une fa9on/ 
15 r6aliste ou originale et, d'une maniere plus generate, de traiter en temps reel la> 
voix, la musique, le bruit ambiant et d'enregistrer Ies resultats .obtenus sur un£ 

support informatique. ■ ' '5 

' f 

Elle s'applique notamment, mais non exclusivement, au grand public et aux 
20 professionals du son qui souhaitent transformer la voix pour des applications 
ludiques, traiter diff&emment la voix et la musique, creer des effets speciaux, 
r^duire le bruit ambiant, et enregistrer, sous forme num6rique compressde, les 
resultats obtenus. 

25 D'une fa9on g6n6rale, on sait que le signal vocal est compost d'un melange de 
signaux transitoires tres complexes (bruits) et de parties de signal quasi- 
p6riodiques (sons harmoniques). Les bruits peuvent etre de petites explosions : 
P, B, T, D, K, GU ; des bruits dififus doux : F, V, J, Z ou intenses CH, S ; 
quant aux sons harmoniques, leur spectre varie avec le type de voyelle et avec 

30 le locuteur. 
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Les rapports d'intensite entre les bruits et les voyelles changent selon qu'il 
s'agit d'une voix conversationnelle, d'une voix parlte type conference, d'une 
voix forte crite ou d'une voix chantee. La voix forte et la voix change 
favorisent les sons vocaliques au detriment des bruits. 

5 

Le signal vocal transmet simultanement deux types de messages : un message 
stmantique convoyt par la parole, expression verbale de la pensee, et un 
message esth&ique perceptible au travers des qualitts esthetiques de la voix 
(timbre, intonation, debit, etc.). 

10 

Le contenu stmantique de la parole, support d'une bonne intelligibility est 
pratiquement independant des qualites de la voix; il est vehicult par les 
formes acoustiques temporelles ; une voix chuchotee n'est constitute que de 
bruits d'tcoulement ; une voix « intime » ou de proximite est constitute d'un 
15 melange de sons harmoniques dans les frequences graves et de bruits 
d'tcoulement dans Paigu ; la voix d'un conftrencier ou d'un chanteur possede 
un spectre vocalique harmonique riche et intense. 

Quant aux instruments de musique, ils sont caracttrises par leur tessiture, 
2p c'est-a-dire l'etendue en frequence de toutes les notes qu'ils peuvent tmettre. 
Neanmoins tres peu d'instruments possedent un « son harmonique », c'est-a- 
dire un fondamental intense accompagnt d'harmoniques dont l'intensitt 
decroit avec le rang. 

25 D' autre part, la tessiture musicale et le contenu spectral ne sont pas 
directement lits ; certains instruments ont les maxima d'energie inclus dans la 
tessiture ; d'autres presentent une zone maximale d'energie bien circonscrite, 
situee a la limite aigue de la tessiture et au-dela ; d'autres enfin ont des 
maxima d'energie tres etalts qui dtbordent largement la limite aigue de la 

30 tessiture. 
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Par ailleurs, on sait que le traitement analogique de ces signaux complexes, 
par exemple leur amplification, provoque, d'une fa9on incontournable, une 
degradation croissante au fur et a mesure dudit traitement et cela d'une 
maniere irreversible, 

5 - 

L'originalite des technologies numeriques est d'introduire un determinisme 
(c'est-a-dire une connaissaiice a priori) le plus important possible au niveau 
des signaux traites de manure a r^aliser des traitements particuliers qui 
r6sideront sous forme de calculs. 

10 

Ainsi, si Ton op6re une transformation du signal representatif d'un son, a 
Porigine sous sa forme naturelle de vibrations, en un signal numerique muni 
des propri^tes evoquees prec6demment, ce signal sera traits sans subir de 
degradation telles que bruit de fond, distorsion et limitation de bande ; 
15 passante ; de plus, il pourra etre traite afm de creer des effets sp£ciaux tels que ) 
la transformation de la voix, la suppression du bruit ambiant, la modification,* 
du souffle de la voix, la differentiation de la voix et de la musique. 

Bien entendu, la technologie audionumerique cpmprend Ies trois etapes 
20 principales : 

® la conversion du signal analogique en un signal numerique, 
© les traitements souhaites transposes en equations a resoudre, 
© la conversion du signal numerique en signal analogique puisque le 
dernier maillon de la chaine genere des vibrations acoustiques. 

25 

D'une maniere generate, on sait que les dispositifs de traitement du son, 
designes sous le terme de vocodeur, comportent les quatre fonctions 
suivantes : 

© T analyse, 
30 • le codeur, 

o le decodeur, 



o la synthese. 
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Par ailleurs, les proced6s de reduction de debit sont employes essentiellement 
pour le stockage numerique (dans le but de diminuer le volume binaire) et 
5 pour la transmission (dans le but de diminuer le d6bit n£cessaire). Ces 
procedes comprennent un traitement pr6alable au stockage ou & la 
transmission (codage) et un traitement a la restitution (d^codage). 

Parmi les procedes de reduction de debit, ceux utilisant les methodes 
10 perceptuelles avec pertes d'information sont les plus employes et notamment 
le procedS MPEG Audio. 

Ce procedS repose sur I'effet de masque de F audition humaine, c'est-i-dire la 
disparition des sons faibles en presence des sons forts, equivalent a un 
15 deplacement du seuil d' audition provoque par le son le plus fort et fonction de 
Pecart de frequence et de niveau entre les deux sons. 

Ainsi, le nombre de bits par echantillon est defini en fonction de Teffet de 
masque etant donnd que les sons faibles et le bruit de quantification sont 
20 inaudibles. Afin de tirer le meilleur profit de cet effet de masque, le spectre 
audio est divis£ en un certain nombre de sous-bandes, permettant ainsi de 
pr^ciser le niveau de masque dans chacune des sous-bandes et de r6aliser une 
allocation binaire pour chacune d' entre elles. 

25 Le proc6d6 MPEG audio consiste ainsi a : 

o numeriser en 16 bits avec un Sckantillonnage k 48 kHz, 

o deduire la courbe de masque entre 20 Hz et 20 kHz, 

o diviser le signal en 32 sous bandes, 

o 6valuer le niveau maximal atteint dans chaque sous bande et durant 

30 24 ms, 

o 6valuer le niveau de bruit de quantification juste inaudible, 
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» allouer le nombre de bits pour le codage, 

• gSnerer le nombre de bits dans la sous bande, 

© encapsuler ces donnees en une trame de donnSes qui se rSpete 
chaque 24 ms. 

5 

Cette technique consiste a transmettre un d6bit binaire variable selon la 
composition instantanee du son. 

Neanmoins, ce proc£de est plutot adapte au traitement de la musique et non au 
10 signal vocal ; il ne permet pas de detecter la presence de la voix ou de la 
musique, de s6parer le signal vocal ou musical et le bruit, de modifier la voix 
en temps r6el pour synth&iser une voix diff&rente mais rSaliste, de synthetiser 
du souffle (bruit) pour creer des effets speciaux, de coder un signal vocal 
comportant une seule voix, de reduire le bruit ambiant. 

15 

L'invention a done plus particulierement pour but de supprimer ces 
inconvenients. 

Elle propose, a cet effet, un proc6de permettant de tirer un meilleur parti des 
20 technologies audionum£riques en effectuant prealablement au codage, une 
analyse du signal audio en considSrant que tout signal sonore dans Pintervalle 
d'une trame est la somme de sinus d' amplitude fixe et dont la frequence est 
modulee lindairement en fonction du temps, cette somme 6tant module 
temporellement par Penveloppe du signal, le bruit etant rajout6 a ce signal 
25 prealablement a ladite somme. 

Selon P invention, ce proc6d6 de transformation de la voix, de la musique et du 
bruit arnbiant, fait essentiellement intervenir : 

30 - durant la phase d' analyse : 

* le calcul de Penveloppe du signal, 
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le calcul du « pitch » (p&iode du fondamental du signal de voix) et 
de sa variation, 

© P application au signal temporel de la variation inverse du «pitch» 

par interpolation lin£aire, 
5 ® la transform^ rapide de Fourrier (TRF) sur le signal pr&raite, 

© P extraction des composantes ftequentielles et leurs amplitudes, 
© P elimination £ventuelle du bruit ambiant par filtrage s61ectif avant 

codage, 



10 - durant la phase de synthase : 

© la sommation des sinus dont P amplitude des composantes 
fr6quentielles varie en fonction de Penveloppe du signal et dont les 
frequences varient lin6airement, 
© le calcul des phases en fonction de la valeur des frequences et des 
15 valeurs des phases et des frequences appartenant a la trame 

pr^cedente, 
© la superposition du bruit, 
o Papplication de Penveloppe, 

20 Uh mode d 5 execution de Pinvention sera decrit ci-apr6s, a titre d'exemple non 
limitatif, avec reference aux dessins annexes, dans lesquels : 

La figure 1 est un organigramme simplifie du procede selon 
Pinvention ; 



25 



La figure 2 est un organigramme de Petape d' analyse ; 



La figure 3 est un organigramme de Petape de synthase ; 



30 La figure 4 est un organigramme de P6tape de codage ; et 



La figure 5 est un schema synoptique d'un dispositif selon l'invention. 

Dans cet exemple, le procede de traitement numerique difference de la voix et 
de la musique selon P invention, repr6sente selon la figure 1, comprend les 
stapes suivantes : 

• analyse du signal vocal (bloc A 1), 

• codage des parametres (bloc A2), 

• sauvegarde des parametres (bloc B), 

• lecture des parametres (bloc B'), 

• decodage des parametres (bloc CI), 

• effets speciaux (bloc C2), 

• synthese (bloc C3). 

Par ailleurs, Panalyse du signal vocal et le codage des parametres constituent; 
les deux fonctionnalites de l'analyseur (bloc A) ; de meme, le decodage des : 
parametres, les effets speciaux et la synthese constituent les fonctionnalites du 
syntihetiseur (bloc C). 

Ces differentes fonctionnalites seront decrites ci-apres, notamment en ce qui 
concerne les differentes Stapes constitutives des procedes d' analyse et de 
synthese. 

D'une maniere g6n6rale, le procede de traitement numerique difference de la 
voix et de la musique comprend essentiellement quatre configurations de 
traitement : 

® la premiere configuration (trajet I) comprenant Panalyse, suivie du 
codage des parametres, suivi de la sauvegarde et de la lecture des 
parametres, suivie du decodage des parametres, suivi des effets 
sp£ciaux, suivis de la synthese, 

© la seconde configuration (trajet II) comprenant Panalyse, suivie du 
codage des parametres, suivi du decodage des parametres, suivi des 
effets speciaux, suivis de la synthese, 



© la troisieme configuration (trajet III) comprenant Panalyse, suivie 

des effets spSciaux, suivis de la synthese, 
o la quatrteme configuration (trajet IV) comprenant le filtre de bruit 

ou la g6n6ration d' effets speciaux k partir de Panalyse, sans passer 

par la synthese, 

Ces difffrentes possibility sont offertes a PapprSciation de Putilisateur du 
dispositif mettant en oeuvre le susdit proc^de, lequel dispositif sera decrit 
ulterieurement. 

Dans cet exemple, la phase d'analyse du signal audio (bloc Al), representee 
selon la figure 2, comprend les Stapes suivantes : 

• mise en forme du signal d* entree (bloc 1), 
© calcul de Penveloppe temporelle (bloc 2), 

© detection d' interpolation temporelle (bloc 3), 
o d6tection du signal audible (bloc 4), 

• calcul de Interpolation temporelle (bloc 5), 
o calcul de la dynamique du signal (bloc 6), 

o detection de trame inaudible apres une trame d'energie plus elevSe 
(bloc 7), 

o traitement d'impulsion (bloc 8), 
o repetition de P impulsion (bloc 9), 

o calcul de la transform^ rapide de Fourrier (TRF) sur impulsion 
rdpftfe (bloc 10), 

o calcul des parametres du signal servant au pr&raitement avant la 

TRF (bloc 11), 
o pr6traitement du signal temporel (bloc 12), 
o calcul de la TRF sur signal traite (bloc 13), 
o calcul du rapport signal a bruit (bloc 14), 
o test de la variation doppler du «pitch» (bloc 15), 
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25 



calcul de la TRF sur signal non traite (bloc 16), 
calcul du rapport signal a bruit (bloc 17), 

comparaison des rapports signal a bruit avec et sans pr6traitement 
(bloc 18), 

restitution du resultat de la TRF avec pr&raitement (bloc 19), 

calcul des frequences et modules (amplitudes des composantes 

frequentielles (bloc 20), 

decision du type de signal (bloc 21), 

test du 50 ou 60 Hz (bloc 22), 

calcul de la dynamique des modules dans le domaine ftequentiel 
(bloc 23), 

suppression de T interpolation sur les donnees frequentielles (bloc 
24), 

suppression du signal inaudible (bloc 25), 
calcul et validation du «pitch» (bloc 26), 

decision si filtrage de bruit ou effets spSciaux, ou continuation de 
Panalyse(bloc27), 

attenuation eventuelle du bruit ambiant (bloc 28), 
fin du traitement de la trame (bloc 29). 



L' exploitation de la transformee rapide de Fourrier (TRF) pour de la voix n'est 
pas envisageable etant donne la variability du signal frequentiel ; en effet la 
variation des frequences cr6e un etalement du resultat de ladite transform^ 
rapide de Fourrier (TRF) ; i'61imination de cet etalement est rendu possible 
grace au calcul de la variation du « pitch » et a Tapplication de la variation 
inverse dudit « pitch » sur le signal temporel. 



30 



Ainsi, Panalyse du signal vocal est effectuSe essentiellement en quatre Stapes : 
« calcul de l'enveloppe du signal (bloc 2), 
o calcul du «pitch» et de sa variation (bloc 12), 
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o application au signal temporel de la variation inverse du «pitch» 
(bloc 12), 

o transform^ rapide de Fourrier (TRF) sur le signal pretraite (bloc 
13), 

5 o elimination eventuelle du bruit ambiant avant codage (blocs 23 a 

28). 

Par ailleurs, quatre seuils (blocs 4, 7, 8, 22) permettent de detecter 
respectivement la presence de signal inaudible, la presence de trame inaudible, 
10 la presence d'une impulsion, la presence de signal perturbateur secteur (50 Hz 
ou 60 Hz). 

D'autre part, un cinqui&me seuil (bloc 15) permet d'effectuer la transform^ 
rapide de Fourrier (TRF) sur le signal non traits en fonction des 
caract6ristiques du «pitch» et de sa variation. 
15 Un sixieme seuil (bloc 18) permet de restituer le resultat de la transformee 
rapide de Fourrier (TRF) avec pretraitement en fonction du rapport signal a 
bruit. 

Enfin, une decision est prise (bloc 27) si le filtrage du bruit ou les effets 
sp6ciaux sont effectuSs ; dans le cas contraire, on continue I'analyse (fteche 
20 IV). 

Deux trames sont exploitees dans le precede d'analyse du signal audio, une 
trame dite « courante », de p&iodicite fixe, contenant un certain nombre 
d^chantillons correspondant au signal vocal, et une trame dite « d'analyse », 
25 dont le nombre d'6chantillons est equivalent & celui de la trame courante ou le 
double, et pouvant 6tre decal6e, en fonction de Interpolation temporelle, par 
rapport k la susdite trame courante. 

La mise en forme du signal d'entrSe (bloc 1) consiste a effectuer un filtrage 
30 passe haut afin d 5 am61iorer le codage futur des amplitudes frSquentielles en 
augmentant leur dynamique ; ledit filtrage passe haut augmente la dynamique 
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d' amplitude fr^quentielle en 6vitant qu'une frequence basse audible n'occupe 
toute la dynamique et fasse disparaitre des frequences de faible amplitude 
mais n&mmoins audibles. Le signal filtr6 est ensuite dirige vers le bloc 2 pour 
la determination de 1'enveloppe temporelle. 

5 

Le calcul de Fenveloppe temporelle (bloc 2) permet de definir : 

- le type de signal, s'il s'agit.d'une impulsion avec ou sans signal de fond 
(bruit ambiant ou musique), 

- la position de la trame d'analyse de Penveloppe du signal par rapport & la 
10 trame courante, 

- Penergie du signal temporel. 

II est effectu6 par une recherche des maxima du signal, consideres comme la 
partie du «pitch» la plus elevSe en valeur absolue. 
15 On calcule ensuite le decalage temporel k appliquer k la trame d'analyse en 
recherchant d'une part le maximum de Penveloppe dans iadite trame puis 
d' autre part deux indices correspondant aux valeurs de Penveloppe inf£rieures 
d'un certain pourcentage a la valeur du maximum. 

Si dans une trame d'analyse on trouve localement un 6cart entre deux 
20 echantillons superieur h un pourcentage de la dynamique maximale de la 
trame et ce durant une dur6e limitee, on declare qu'une impulsion br£ve est 
contenue dans la trame en for9ant les indices de decalage temporels aux 
valeurs entourant P impulsion additionnelle. 

25 La detection d'interpolation temporelle (bloc 3) permet de corriger les deux 
indices de decalage de la trame d'analyse troiiv6s dans le calcul pr6c6dent, et 
ce en prenant en compte le pass6. 

Un premier seuil (bloc 4) d&ecte ou non la presence d'un signal audible en 
30 mesurant la valeur maximale de Tenveloppe ; dans F affirmative, Fanalyse de 
la trame est termin^e ; dans le cas contraire, le traitement continu. 
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Un calcul est ensuite effectuS (bloc 5) des parametres associ£s au decalage 
temporel de la trame d' analyse en determinant le parametre d'interpolation des 
modules qui est egal au rapport de Penveloppe maximale dans la trame 
5 courante a celle de la trame ddcalee. 

La dynamique du signal est ensuite calculee (bloc 6) pour sa normalisation 
afin de diminuer le bruit de calcul ; le gain de normalisation du signal est 
calculi & partir de Pechantillon le plus £Iev£ en valeur absolue dans la trame 
10 d' analyse. 

Un second seuil (bloc 7) d&ecte ou non la presence d'une trame inaudible par 
effet de masque provoqu£ par les precedentes trames ; dans P affirmative, 
T analyse est termin£e ; dans le cas contraire, le traitement continue. 

15 

Un troisiSme seuil (bloc 8) detecte ensuite ou non la presence d'une 
impulsion ; dans P affirmative, un traitement specifique est effectu£ (blocs 9, 
10); dans le cas contraire, les calculs des parametres du signal (bloc 11) 
servant au pr6traitement du signal temporel (bloc 12) seront effectu6s. 

20 

En presence d'une impulsion, la repetition de Pimpulsion (bloc 9) est 
effectuee en creant un « pitch » artificiel, egal a la dur6e de Pimpulsion, de 
maniere a 6viter le masquage des frequences utiles lors de la transformee 
rapide de Fourrier (TRF). 
25 La transformee rapide de Fourrier (TRF) (bloc 10) est ensuite realisde sur 
Pimpulsion r£pet£e en ne conservant que la valeur absolue du nombre 
complexe et non la phase ; le calcul des frequences et des modules des 
donnees frequentielles (bloc 20) est ensuite effectue. 

30 En Pabsence d'impulsion, le calcul des parametres du signal (bloc 11) est 
effectu6, lesquels parametres concement : 
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- le calcul du « pitch » et de sa variation, 

- la definition du nombre d'echantillons dans la trame d' analyse. 

En fait, le calcul du « pitch » est effectue pr<§alablement par une differentiation 
5 du signal de la trame d' analyse, suivi d'un filtrage passe bas des composantes 
de rang 61ev6, puis d'une elevation au cube du resultat dudit filtrage ; la valeur 
du « pitch » est determined par le calcul de la distance minimale entre une 
portion de signal d'&iergie elev6e avec la suite du signal subsequent, 6tant 
doxm€ que la susdite distance minimale est la somme de la valeur absolue des 

10 differences entre les echantillons du gabarit et les Echantillons a corr£ler ; 
ensuite, la partie principale d'un « pitch » centr£e autour de une fois et demie 
la valeur du « pitch » est recherchee en d£but de trame d'analyse afin de 
calculer la distance de cette portion de « pitch » sur Tint^gralite de la trame 
d'analyse ; ainsi, les distances minimales d£finissent les positions des.?. 

15 « pitch », le « pitch » etant la moyenne des «pitchs» detects; puis la 
variation du « pitch » est calcutee a Taide d'une droite qui minimise 1' erreur &v 
quadratique moyenne des successions des «pitchs » d6tectes ; le « pitch » i 
estim6 en debut et en fin de trame d'analyse ea est d£duit ; si le « pitch » V 
temporel en fin de trame est sup6rieur & celui en debut de trame, la variation 

20 du « pitch » est 6gale au rapport du « pitch » estime de d£but de trame a celui 
de fin de trame, diminu£ de 1 ; inversement, si le « pitch » temporel en fin de 
trame est inferieur a celui en debut de trame, la variation du « pitch » est egal a 
1 diminu£ du rapport du « pitch » estime en fin de trame k celui en debut de 
trame. 

25 

La variation du « pitch », trouv£e et validee prec£demment, sera soustraite du 
signal temporel dans le bloc 12 de pr&raitement temporel, en n'utilisant que le 
premier ordre de ladite variation. 
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La soustraction de la variation du « pitch » consiste a 6chantillonner la trame 
d' analyse avec un pas d'echantillonnage variant avec la valeur inverse de 
ladite variation du « pitch ». 

5 Apr&s Elimination de la variation du « pitch », ledit « pitch » semble identique 
sur toute la fenetre d'analyse, ce qui donnera un resultat de la transform^ 
rapide de Fourrier (TRP) sans etalement de frequences ; la transform^ rapide 
de Fourrier (TRF) pourra etre ensuite effectuEe dans le bloc 13 afin de 
connaitre le domaine frequentiel de la trame d' analyse ; la methode utilis6e 

10 permet de calculer rapidement le module du nombre complexe au detriment de 
la phase du signal. 

Le calcul du rapport du signal a bruit est effectue sur la valeur absolue du 
resultat de la transformee rapide de Fourrier (TRF) ; le susdit rapport est en 

15 fait le rapport de la difference de Penergie du signal et du bruit a la somme de 
Penergie du signal et du bruit ; le numerateur du susdit rapport correspond au 
logarithme de Pecart entre deux pics d'energie, respectivement du signal et du 
bruit, le pic d'&iergie etant celui qui est soit superieur aux quatre Echantillons 
adjacents correspondant au signal harmonique, ou inferieur aux quatre 

20 echantillons adjacents correspondant au bruit ; le d£nominateur est la somme 
des logarithmes de tous les pics du signal et du bruit ; par ailleurs, le calcul du 
rapport signal a bruit se fait par sous-bande, les sous-bandes les plus 61evees, 
en terme de niveau, sont moyennees et donnent le rapport recherche. 

25 Le calcul du rapport de signal k bruit, defini comine etant le rapport signal 
moins le bruit a signal plus le bruit, effectuE dans le bloc 14, permet de 
determiner si le signal analyse est un signal vois6 ou de la musique, cas d'un 
rapport 61ev6 ? ou du bruit, cas d'un rapport faible. 

30 Cette distinction est ensuite effectuee dans le bloc 15 ; en fait, des tests sont 
effectu6s sur la variation doppler du « pitch » et sur la frequence du « pitch » ; 
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si la variation du « pitch » est faible ou sa frequence elevee, le traitement est 
imm6diatement suivi par le calcul des frequences et des modules des donn£es 
fftSquentielles de la transform^ rapide de Fourrier (TRF) (bloc 20) ; dans le 
cas contraire, la transform^ rapide de Fourrier (TRF) est effectu6e sans 
5 pretraitement (bloc 16). 

Le calcul du rapport signal a bruit est ensuite effectue dans le bloc 17, de 
manidre k transmettre au bloc 20 les resultats de la transform^ rapide de 
Fourrier (TRF) sans pr&raitement, cas d'une variation du « pitch » nulle, ou, 
10 dans le cas contraire a restituer les resultats de la transformee rapide de 
Fourrier (TRF) avec pr&raitement (bloc 19). 

Cette distinction est effectuee dans le bloc 1 8, de la manidre suivante : 

- si le rapport signal a bruit sans pr&raitement est superieur au rapport signal : 
15 k bruit avec pretraitement, les r6sultats de la transformee rapide de Fourrier i 

(TRF) sont transferes au bloc 20, i 

- si le rapport signal a bruit sans pretraitement est infSrieur au rapport signal ; i* 
k bruit avec traitement,' la restitution des r6sultats de la transformee rapide i 
de Fourrier (TRF) avec pretraitement 6tant effectuee dans le bloc 19, les 

20 resultats obtenus avec pretraitement sont ensuite transfers dans le bloc 20. 

Ce test permet de valider la variation du « pitch », qui pourrait etre non nulle 
pour de la musique, alors que celle-ci doit effectivement 6tre nulle. 

25 Le calcul des frequences et des modules des donnees fr6quentielles de la 
transformee rapide de Fburrier (TRF) est effectue dans le bloc 20. 
La transformee rapide de Fourrier (TRF), pr6c6demment citee en reference 
aux blocs 10, 13, 16, est realisde, a titre d'exemple, sur 256 echantillons dans 
le cas d'une trame decalee ou d'une impulsion, ou sur le double d' echantillons 

30 dans le cas d'une trame centime sans impulsion. 
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Une ponderation des £chantillons situ^s anx extremity des prelevements, dite 
de Hamming, est effectue dans le cas de la transformee rapide de Fourrier 
(TRF) sur n echantillons ; sur 2n £chantillons, on utilise la fenStre de 
ponderation de Hamming muitipliee par la racine carr£e de la fenetre de 
5 Hamming. 

A partir des valeurs absolues des donnees complexes de la transform^ rapide 
de Fourrier (TRF), on calcule le rapport entre deux valeurs maximales 
adjacentes, chacune repr£sentant le produit de r amplitude de la composante 
fr6quentielle par un sinus cardinal ; par approximations successives, on 

10 compare ce rapport entre les valeurs maximales, k des valeurs contenues dans 
des tableaux contenant ce meme rapport, pour N frequences (par exemple 32 
ou 64) reparties uniform£ment sur un demi £chantillon de la transformee 
rapide de Fourrier (TRF). L'indice dudit tableau qui definit le rapport le plus 
proche de celui a comparer donne d'une part le module et d'autre part la 

15 frequence pour chaque maximum de la valeur absolue de la transformee rapide 
de Fourrier (TRF). 

Par ailleurs, le calcul des frequences et des modules des donnees frdquentielles 
de la transformee rapide de Fourrier (TRF), effectue dans le bloc 20, permet 
20 egalement de detecter un signal DTMF (multifrequence k double tonalite) en 
tel£phonie. 

11 est k noter que le rapport signal k bruit est le critere essentiel qui definit le 
type de signal. 

25 

Afin de determiner l'&iergie du bruit k generer a la synthase et la precision du 
codage, le signal extrait du bloc 20 est categorise en quatre types dans le bloc 
21, a savoir : 

- type 0 : signal vois6 ou musique. 



- 17- 



Le « pitch » et sa variation peuvent etre non nuls ; le bruit appliqu6 a la 
synthese sera de faible 6nergie ; le codage des pararnetres sera effectue avec la 
precision maximale. 

- type 1 : signal non vois6 et eventuellement de la musique. 

5 Le « pitch » et sa variation sont nuls ; le bruit appliqu6 a la synthase sera de 
forte energie ; le codage des pararnetres sera effectue avec la precision 
minimale. 

- type 2 : signal vois6 ou musique. 

Le « pitch » et sa variation sont nuls ; le bruit appliqu6 & la synthese sera de 
10 moyenne Energie ; le codage des pararnetres sera effectue avec une precision 
intermediate. 

- type 3 : ce type de signal est decide en fin d' analyse lorsque le signal a 
synth&iser est nul. 

15 Une detection de presence ou de non presence de signal perturbateur a 50 Hz 
(60 Hz) est effectuee dans le bloc 22 ; le niveau du seuil de detection est /. 
fonction du niveau du signal recherche de maniere a eviter de confondre la 
perturbation electromagn&ique (50, 60 Hz) et la fondainentale d'un instrument A-'l 
de musique. 

20 En presence du signal perturbateur recherche, 1'analyse est terminSe afin de 
diminuer le d6bit binaire : fin du traitement de la trame r6ferenc6e par le bloc 
29. 

Dans le cas contraire, en V absence de signal perturbateur, on continue 
P analyse. 

25 

Un calcul de la dynamique des amplitudes des composantes frequentielles, ou 
modules, est effectu6 dans le bloc 23 ; la susdite dynamique ftequentielle est 
utilis^e pour le codage ainsi que pour la suppression des signaux inaudibles 
effectu6e ult6rieurement dans le bloc 25. 



30 
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Ainsi, Ie plan frequentiel est subdivise en plusieurs parties, chacune d'entre- 
elles possede plusieurs plages d' amplitude differenctees en fonction du type de 
signal detecte au niveau du bloc 21. 

5 D'autre part, T interpolation temporelle et ['interpolation frequentielle sont 
supprimees au niveau du bloc 24 ; celles-ci avaient 6t6 effectu^es pour 
optiraiser la qualite du signal. 

1/ interpolation temporelle qui donne des modules plus £lev£s, sera retiree en 
multipliant chaque module par le param£tre de normalisation calcule au niveau 
10 du bloc 5. 

L'interpolation frequentielle depend de la variation du « pitch » ; celle-ci sera 
supprimee en fonction du dScalage d'un certain nombre d'£chantillons et du 
sens de la variation du « pitch ». 

15 La suppression du signal inaudible est effectu^e ensuite dans le bloc 25. En 
effet, certaines frequences sont inaudibles car masquees par d'autres signaux 
d' amplitude plus elevees. 

L'elimination de ces dites frequences inaudibles permettra de diminuer le 
debit et aussi d'ameliorer le calcul du « pitch » gr&ce a la suppression du bruit. 
20 Tout d'abord, on effectue une Elimination des amplitudes situees en de9a de la 
limite inferieure de la plage d'amplitude, puis on Eloigne les frequences dont 
Tintervalle est inferieure a une unite frequentielle, definie comme etant la 
frequence d'echantillonnage par unite d'echantillon. 

Ensuite, on eiimine les composantes inaudibles & Paide d'un test entre 
25 P amplitude de la composante frequentielle a tester et 1' amplitude des autres 
composantes adjacentes multipliee par un temie att&iuateur fonction de la 
difference entre leur frequence. 

Par ailleurs, on limite le nombre de composantes frequentielles a une valeur 
au-dela de laquelle la difference sur le resultat obtenu n'est pas perceptible. 

30 



-19- 



Le calcul du « pitch » et la validation du « pitch » sont effectu^s au niveau du 
bloc 26 ; en effet le « pitch » calcule dans le bloc 11 sur le signal temporel a 
6t6 determine dans le domaine temporel en pr6sence de bruit ; le calcul du 
« pitch » dans le domaine frequentiel permettra d'am&iorer la precision du 
5 « pitch » et de detecter un « pitch » que le calcul sur le signal temporel, 
effectue dans le bloc 1 1, n'aurait pas d6termin6 k cause du bruit ambiant. 
Par ailleurs, le calcul du «pitch» sur le signal fr6quentiel doit permettre de 
decider si celui-ci doit 6tre utilise au codage, sachant que Putilisation du 
« pitch » au codage permet de diminuer fortement le codage et de rendre la 

10 voix plus naturelle k la synthese ; il est par ailleurs utilise par le filtre de bruit. 
Etant donn6 que les frequences et les modules de la trame sont disponibles, le 
principe du calcul du « pitch » consiste k synth&iser le signal par une somme 
de cosinus ayant des phases k Porigine nulles ; ainsi la forme du signal 
original sera reconstitue sans les perturbations de Penveloppe, des phases et de 

15 la variation du « pitch ». 

La valeur du « pitch » frequentiel est definie par la valeur du « pitch » i 
temporel laquelle est Squivalente a la premiere valeur de synthase pr^sentant >L: 
un maximum superieur au produit d'un coefficient par la somme des modules r • 
utilises pour la synthese locale (somme des cosinus desdits modules); ce 

20 coefficient est egal au rapport de Periergie du signal, consid6re comme 
harmonique, a la somme de Penergie du bruit et de Penergie du signal ; le 
susdit coefficient est d'autant plus faible que le « pitch » a d^tecter est noye 
dans le bruit ; k titre d'exemple, k un rapport signal a bruit de 0 decibel 
correspond un coefficient de 0,5. 

25 

L'information de validation du « pitch » frequentiel est obtenue a Paide du 
rapport de P6chantillon de synthase, a Pendroit du « pitch », a la somme des 
modules utilises pour la synthase locale ; ce rapport, synonyme d'6nergie du 
signal harmonique sur Penergie totale du signal, est corrig6 en fonction du 
30 rapport approximatif signal k bruit calcuI6 dans le bloc 14 ; Pinformation de 
validation du « pitch » depend du d^passement du seuil de ce rapport. 
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Afin d'eviter de valider un « pitch » sur du bruit ou de la musique, quand le 
seuil de detection du « pitch » est faible, un controle de V existence d'un 
« pitch » est effectu6 aux emplacements des multiples du « pitch » temporel 
dans la synthase locale ; ainsi le « pitch » n'est pas valide si le niveau de la 
5 synthese est trop faible pour etre un « pitch » aux susdits emplacements des 
multiples du « pitch » temporel. 

La synthase locale est calculee deux fois ; une premiere fois en n'utilisant que 
les frequences dont le module est 61ev6, afin de s'affranchir du bruit pour le 
calcul du « pitch » ; une deuxieme fois avec la totality des modules limites en 
10 valeur maximale, afin de calculer le rapport signal a bruit qui validera le 
« pitch » ; en effet la limitation des modules donne plus de poids aux 
frequences non harmoniques k module faible, afin de diminuer la probabilite 
de validation d'un « pitch » sur de la musique. 

15 Dans le cas du filtrage du bruit, les valeurs desdits modules ne sont pas limits 
pour la deuxieme synthese locale, seul le nombre de frequences est limite en 
ne prenant en compte que celles qui ont un module significatif afin de limiter 
le bruit. 

20 Un second proc&te de calcul du « pitch » consiste a s^lectionner le « pitch » 
qui donne Penergie maximale pour un pas d'echantillonnage de la synthese 
egal au « pitch » recherche ; ce proc6de est utilise pour de la musique ou un 
milieu sonore comportant plusieurs voix. 

25 Pr6alablement k la derni&re 6tape consistant a attenuer le bruit, une decision 
sera prise par Putilisateur s'il souhaite rdaliser le filtrage du bruit ou g&ierer 
des effets sp6ciaux (bloc 27), a partir de Tanalyse, sans passer par la synthese. 
Dans le cas contraire, Panalyse se terminera par le traitement suivant 
consistant h attenuer le bruit, dans le bloc 28, en diminuant les composantes 

30 fr6quentielles qui ne sont pas un multiple du « pitch » ; apres attenuation 



desdites composantes frequentielles, on effectuera k nouveau la suppression du 
signal inaudible, tel que decrit pr6c6demment > au niveau du bloc 25, 
L/att6nuation desdites composantes frequentielles est fonction du type de 
signal tel que definit prec^demment par le bloc 21 . 

Apres avoir effectue ladite attenuation du bruit, on peut considerer que le 
traitement de la trame est termini ; 1'aboutissement de ladite phase d'analyse 
est reference par le bloc 29. 

En reference k la figure 1 representant un organigramme simplify du procede 
selon Pinvention, dans cet exemple, la phase de synthase du signal audio (bloc 
C3), representee selon la figure 3, comprend les etapes suivantes : 

• mise en forme des modules (bloc 31), 

• reduction du bruit (bloc 32), 

• mise k niveau du signal (bloc 33), 

• saturation des modules (bloc 34), , 

• modification des parametres d' impulsion en fonction de la vitesse 
de la synthase (bloc 35), 

© calcul des phases (bloc 36), 
® generation du souffle (bloc 37), 

e decision concemant la generation d'une impulsion (bloc 38), 

• synthese avec les donnees frequentielles de la trame courante (bloc 
39), 

® test concemant la trame precedente (bloc 40), 
® synthese avec les donnees frequentielles de la trame precedente 
(bloc 41), 

« application de Penveloppe sur le signal de synthese (bloc 42), 
o decision concemant Tajout d'une impulsion (bloc 43), 

synthese avec les npuvelles donnees frequentielles (bloc 44), 
® connexion entre trames adjacentes (bloc 45), 
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® transfert du resultat de synthese dans la trame d'echantillon (bloc 
46), 

o sauvegarde du bord de trame (bloc 47), 
© fin de la synthese (bloc 48). 

La synthese consiste a calculer les echantillons du signal audio a partir des 
parametres calcules par l'analyse; les phases et le bruit seront calcules 
artificiellement suivant le contexte. 

La mise en forme des modules (bloc 31) consiste a eliminer l'attenuation du 
filtre d'entree des echantillons de l'analyse (bloc 1 du bloc Al) et a tenir 
compte du sens de la variation du»pitch» car la synthese est realisee 
temporellement par un increment de phase d'un sinus. 

Par ailleurs, rinformation de validation du « pitch » est supprimee si I'option 
de synthese de la musique est validee ; cette option ameliore le calcul de phase 
des frequences en evitant de synchroniser les phases des harmoniques entre 
elles en fonction du « pitch ». 

La reduction du bruit (bloc 32) est effectuee si celle-ci n'a pas et6 
prealablement effectuee durant l'analyse (bloc 28 du bloc Al). 

La mise a niveau du signal (bloc 33) supprime la normalisation des modules 
recus de Panalyse ; cette mise a niveau consiste a multiplier les modules par 
l'inverse du gain de normalisation defini dans le calcul de la dynamique du 
signal (bloc 6 du bloc Al) et a multiplier lesdits modules par 4 afm d' eliminer 
1'effet de la fen6tre de Hamming, et que seule la moitie du plan frequentiel est 
utilis6e. 

La saturation des modules (bloc 34) est effectuee si la somme des modules est 
superieure a la dynamique du signal des echantillons de sortie ; elle consiste a 
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multiplier les modules par le rapport de la valeur maximale de la somme des 
modules a la somme des modules, au cas oij ledit rapport est infSrieur a L 

L'impulsion est re-gen£r6e en r£alisant la somme de sinus dans la duree 
5 d'impulsion ; les param&res d'impulsion sont modifies (bloc 35) en fonction 
de la vitesse variable de synthase. 

Le calcul des phases des frequences est effectue enstiite (bloc 36) ; il a pour 
but de donner une continuity de phase entre les frequences des frames ou de 
10 re-synchroniser les phases entre elles ; elle rend par ailleurs la voix plus 
naturelle. 

La synchronisation des phases est r£alis£e a chaque fois qu'un nouveau signal 
dans la trame courante semble separe dans le domaine temporel ou dans le 
domaine fr^quentiel de la trame prec6dente ; cette separation correspond : . 
15 • au passage de signal bruite a un signal non bruite, :.k 

• a un d£but de mot (ou son) dont Tenveloppe en debut de trame est : k 
faible, ■ v 

: • • a une transition entre deux mots (ou son) sans variation de 
Penveloppe, 

20 9 & un debut de mot (ou son) qui a et6 detects dans la trame 

precedente, mais dont la montee de l'enveloppe dans la trame 
'courante est telle que la synchronisation doit etre refaite pour que les 
phases soient calculees en fonction d'un « pitch » de meilleure 
qualite. 

25 , 

La continuity de phase consiste & rechercher les frequences de la trame 
courante en debut de trame qui sont les plus proches des frequences en fin de 
trame de la trame pr6cedente ; ensuite la phase de chaque frequence devient 
egale k celle de la frequence pr6cedente la plus proche, sachant que les 

30 frequences en debut de trame courante sont calculees & partir de la valeur 
centrale de la frequence modifi6e par la variation du « pitch ». 
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En pr6sence d'un « pitch », cas du signal voise, les phases des harmoniques 
seront synchronises sur celle du pitch en multipliant la phase du « pitch » par 
Tindice de rharmonique du « pitch » ; quant a la continuity de phase, on 
5 calcule la phase du « pitch » en fin de trame en fonction de sa variation et de la 
phase a Porigine de la trame ; cette phase servira pour le d€but de la trame 
suivante. 

La g6n6ration du souffle est ensuite effectu6e (bloc 37). 

10 

Selon Pinvention, on consid&e que tout signal sonore dans Pintervalle d'une 
trame est la somme de sinus d'amplitude fixe et dont la frequence est modutee 
lin^airement en fonction du temps, cette somme 6tant modulee temporellement 
par Penveloppe du signal, le bruit etaxit rajout6 a ce signal prealablement a 
15 ladite somme. 

Sans ce bruit, la voix est metallique car P61imination des modules faibles, 
effectuee dans le bloc 25 du bloc A3, concerne essentiellement le souffle. 
Par ailleurs, P estimation du rapport signal a bruit effectuee dans le bloc 14 du 
bloc A3, n'est pas exploitee ; on calcule en effet un bruit en fonction du type 

20 de signal, des modules et des frequences. 

Le principe du calcul du bruit repose sur un filtrage d'un bruit blanc par un 
filtre transversal dont les coefficients sont calculus par la somme des sinus des 
frequences du signal dont les amplitudes sont attenuSes en fonction des 
valeurs de leur frequence et de leur amplitude. Une fenetre de Hamming est 

25 ensuite appliqu6e sur les coefficients pour diminuer les lobes secondaires. 
Le bruit filtr6 est ensuite sauvegarde en deux parties distinctes. 
Une premiere partie permettra de faire le lien entre deux frames successives ; 
la connexion entre deux trames est realis^e par chevauchement de ces deux 
trames dont chacune est pond£r6e lineairement et en sens inverse ; ledit 

30 chevauchement est effectu6 lorsque le signal est sinusoidal ; il ne s'applique 
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pas quand il s'agit de bruit non correie ; ainsi la partie sauvegardee du bruit 
filtre est rajoutee sans ponderation sur la zone de chevauchement. 
La seconde partie est destinSe au corps principal de la trame. 
Le lien entre deux trames doit d'une part permettre un passage fluide entre 
5 deux filtres de bruit de deux trames successives, et d' autre part de prolonger le 
bruit de la trame suivahte au-dela de la partie de chevauchement des trames si 
un debut de mot (ou son) est detecte. : 

Ainsi, le passage fluide entre deux trames est realist par la somme du bruit 
blanc filtre par le filtre de la trame precedente ponder^ par une pente 
10 descendante lineaire, et le m6me bruit blanc filtre par le filtre de bruit de la 
trame courante ponder^ par la pente montante inverse de celle du filtre de la 
trame precedente. 

L'energie du bruit sera rajoutee a Tenergie de la somme des sinus, selon le 
proc^de propose. 

15 

La generation d'une impulsion differe d'un signal sans impulsion ; en effet, ■? 
dans le cas de la generation d'une impulsion, la somme des sinus n'est realisee 
que sur une partie de la trame courante & laquelle est rajoutee la somme des 
sinus de la trame precedente. 

20 

Cette distinction necessite de faire le choix (bloc 38) entre les deux options : 
, une impulsion doit elle Stre gen&ee ou non ? ; dans le cas oft il n'y a pas de 
generation d'une impulsion , on effectue la synthesc avec les nouvelles 
donnees frequentielles (bloc 39) ; dans le cas contraire, il s'agit de savoir si la 
25 trame precedente n'etait pas une impulsion (bloc 40) ; dans ce cas on effectue 
la synthase avec les donnees frequentielles de la trame precedente (bloc 41) 
qui va servir de fond a Pimpulsion (cas de la musique ou de bruit ambiant k 
repeter) ; dans le cas contraire, la trame precedente etant une impulsion, on ne 
repete pas le signal de fond avec les parametres de Pirnpulsion precedente. 



30 
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La synthese avec les nouvelles donnees frequentielles (bloc 39) consiste a 
effectuer la somme des sinus des composantes frequentielles de la trame 
courante ; la variation de la longueur de la trame permet d'effectuer vine 
synthese k vitesse variable ; nSanmoins les valeurs des frequences en debut et 
5 en fin de trame doivent 6tre identiques, quelque soit la longueur de la trame, 
pour une vitesse donnee de synthese. 

La phase assoctee au sinus, fonction de la frequence, sera calcul6e par 
iteration ; en effet pour chaque iteration, on calcule le sinus multiplie par le 
module ; le resultat est ensuite somme pour chaque echantillon suivant toutes 
10 les frequences du signal. 

Dans le cas d'une impulsion k g£n6rer, les phases k Porigine des donnees 
frequentielles sont maintenues a la valeur 0. 

Afin de r6aliser une connexion fluide entre les trames, le calcul de la somme 
des sinus est egalement effectue sur une portion precedant la trame et sur une 

15 meme portion suivant la trame ; les parties aux deux bouts de la trame seront 
ensuite somm£es avec celles des trames adjacentes par ponderation lineaire. 
Dans le cas d'une impulsion, la somme des sinus est effectuee dans Pintervalle 
de temps de generation de Pimpulsion ; afin d'eviter la creation d'impulsions 
parasites suite aux discontinues dans le calcul de la somme des sinus, un 

20 certain nombre d'echantillons situ£s au debut et k la fin de la sequence sont 
ponderes respectivement par une pente montante et une pente descendants 
Quant au cas des frequences harmoniques du « pitch », les phases ont ete 
calcuiees precedemment pour etre synchronisees, elles seront generees k partir 
de Pindice de Pharmonique correspondant. 

25 

La synthese par la somme des sinus avec les donnees de la trame precedente 
(bloc 41) est effectu6e lorsque la trame courante contient une impulsion a 
generer ; en effet, dans le cas de la musique ou de bruit, si la synthese n'est 
pas effectuee sur la trame precedente, servant de signal de fond, Pimpulsion 
30 sera generee sur un silence, ce qui est prejudiciable k une bonne qualite du 
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resultat obtenu ; par ailleurs la continuity de la trame pr^cedente est inaudible, 
merae en presence d'une progression du signal* 

L'application de Penveloppe sur le signal de synthase (bloc 42) est effective h 
5 partir des valeurs £chantillonnees de Penveloppe precedemment d6termin6es 
(bloc 2 du bloc A3) ; par ailleurs la connexion entre deux trames successives 
est r6alisee par la somme porid6ree, comme indiquS precedemment ; cette 
pond£ration par les courbes croissante et decroissarite n'est pas effectu£e sur le 
bruit, car le bruit n'est pas juxtapose entre trame. 
10 Enfin, dans le cas de la synthese k vitesse variable, la longueur de la trame 
varie par pas afin d'etre homogdne avec Pechantillonnage de Penveloppe. 

Le rajout d'une impulsion par la somme de sinus dans Pintervalle ou a 6t€ 
detectee Pimpulsion, est effectu£ (bloc 44) en fonction du test realise- 
15 precedemment (bloc 43). 

■ ■• • *&' 

La ponderation de juxtaposition entre deux trames est ensuite effectu^e (bloc 3 
45) comme indiqu6 precedemment. r 

20 Le transfert du rSsultat de synthese (bloc 46) sera ensuite effectu^ dans la 
trame de sortie d'echantillon afin que ledit resultat soit sauvegardS. 

De m6me, la sauvegarde du bord de trame (bloc 47) sera effectu6e afin que 
ledit bord de trame puisse etre addition^ au ddbut de la trame suivante. 

25 

L'aboutissement de ladite phase de synthese est r£f£rencde par le bloc 48, 

En reference a la figure 1 repr&entant un organigramme simplify du proc£d6 
selon T invention, dans cet exemple, la phase de codage des param&tres (bloc 
30 A2), representee selon la figure 4, comprend les etapes suivantes : 
® codage du type de signal (bloc 51), 
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® test sur le type de signal (bloc 52), 

© codage du type de compression (bloc 53), 

© codage de la valeur de normalisation du signal de trame (bloc 54), 

® test sur la presence d'impulsion (bloc 55), 

5 ® codage des parametres d'impulsion (bloc 56), 

9 codage de la variation du « pitch » (bloc 57), 

© limitation du nombre de frequences a coder (bloc 58), 

© codage des valeurs d 5 6chantillonnage de Penveloppe (bloc 59), 

* codage de la validation du « pitch » (bloc 60), 

10 <* test de validation du « pitch » (bloc 61), 

o codage des harmoniques (bloc 62), 

© codage des frequences non harmoniques (bloc 63), 

© codage de la dynamique des modules (bloc 64), 

© codage du module le plus eleve (bloc 65), 

15 ® codage des modules (bloc 66), 

© codage de P attenuation (bloc 67), 

© suppression de la normalisation des modules (bloc 68), 

<s> codage des fractions frequentielles des frequences non harmoniques 
(bloc 69), 

20 ® codage du nombre d 5 octets de codage (bloc 70), 

o fin de codage (bloc 71). 



Le codage des parametres (bloc A2) calcules dans P analyse (bloc Al) dans le 
proced6 selon Pinvention, consiste h limiter la quantity d ? informations utiles 
25 afm de reproduire a la synthese (bloc C3) apres decodage (bloc CI) un 
Equivalent auditif au signal audio d'origine. 

Le codage etant de longueur variable, chaque trame codee a un nombre de bits 
d'information propre ; le signal audio etant variable, plus ou moins 
d' informations seront a coder. 
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Les parametres de codage etant interdependants, un parametre code 
influencera le type de codage des parametres suivants. 

Par ailleurs, le codage des parametres peut etre soit lineaire, le nombre de bits 
6tant fonction du nombre de valeurs, soit de type HUFFMAN, le nombre de 
bits &ant fonction statistique de la valeur a coder (plus la donnee est frequente, 
moins elle utilise de bits et reciproquement). 

Le type de signal, tel que defini lors de l'analyse (bloc 21 du bloc Al), fournit 
rinformation de generation du bruit et la quality du codage a utiliser ; le 
codage du type de signal est effectu<§ en premier lieu (bloc 51). 

Un test est ensuite effectug (bloc 52) permettant dans le cas du type 3 du 
signal, tel que defini dans le bloc 21 de l'analyse (bloc Al), de ne pas ' 
effectuer de codage des parametres ; la synthese comportera des echantillohs 
mils. 

Le codage du type de compression (bloc 53) est utilise dans le cas ou 
1'utilisateur souhaite agir sur le debit des donnees de codage, au d6triment de 
la qualite ; cette option peut 6tre avantageuse en mode t616communication 
associ6 k un taux de compression elev6. 

Le codage de la valeur de normalisation (bloc 54) du signal de la trame 
d'analyse est de type HUFFMAN. 

Un test sur la presence d'impulsion. (bloc 55) est ensuite effects, permettant 
en cas de synthese d'une impulsion, de coder les parametres de ladite 
impulsion. 
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En cas de presence d'une impulsion, le codage, suivant une loi lineaire, des 
parametres de ladite impulsion (bloc 56) sera effectue sur le debut et la fm de 
ladite impulsion dans la trame courante. 

5 Quant au codage de la variation doppler du « pitch » (bloc 57), il sera effectu6 
suivant une loi logarithmique, en tenant compte du signe de la dite variation ; 
ce codage ne sera pas effectue en presence d'une impulsion ou si le type de 
signal est non vois6. 

10 Une limitation du nombre de frequences a coder (bloc 58) est ensuite effectuee 
afm d'eviter qu'une frequence de valeur haute ne depasse la dynamique 
bornee par la frequence d'echantillonnage, etant donne que la variation 
doppler du « pitch » fait varier les frequences durant la synthese. 

15 Le codage des valeurs d'echantillonnage de l'enveloppe (bloc 59) depend de 
la variation du signal, du type de compression, du type de signal, de la valeur 
de normalisation et de l'eventuelle presence d'impulsion; ledit codage 
consiste a coder les variations et la valeur minimale desdites valeurs 
d'echantillonnage. 

20 

La validation du « pitch » est ensuite codee (bloc 60), suivi d'un test de 
validation (bloc 61) necessitant, dans 1' affirmative, de coder les frdquences 
harmoniques (bloc 62) suivant leur indice par rapport a la frequence du 
« pitch ». Quant aux frequences non harmoniques, elles seront cod6es (bloc 
25 63) suivant leur partie entiere. 

Le codage des frequences harmoniques (bloc 62) consiste tout d'abord a coder 
la partie entiere de la fr6quence du « pitch », puis la partie fractionnaire 
associ6e ainsi que les indices des harmoniques ; le codage desdits indices des 
30 harmoniques est effectue en fonction de leur pr6sence ou de leur absence par 
paquet de trois indices selon le codage d'HUFFMAN. 
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Les frequences qui n'ont pas 6t6 detectees comme etant harmoniques de la 

frequence du « pitch » seront codees separement (bloc 63). 

Afin d'eviter qu'au moment du codage, une frequence non harmonique change 

5 de position par rapport a une frequence harmonique, on supprime la frequence 
non harmonique qui est trop proche de la frequence harmonique, sachant 
qu'elle a moins de poids au sens audible ; ainsi la suppression a lieu si la 
frequence non harmonique est superieure a la frequence harmonique et que la 
fraction de la frequence non harmonique due au codage de la partie enti6re, 

10 rend ladite frequence non harmonique inferieure k la frequence harmonique 
proche. 

Le codage des frequences non harmoniques (bloc 63) consiste & coder le 
nombre de frequences non harmoniques, puis la partie entiere des frequences, 
puis les parties fractionnaires quand les modules seront codes ; concemant le 

15 codage de la partie entiere des frequences, seuls les ecarts entre lesdites parties 
eritieres sont codes ; par ailleurs, plus le module est faible et plus la precisidh 
sur la partie fractionnaire est faible ; ceci afin de diminuer le debit binaire. 
Afin d'optimiser le codage en terme de debit de4a partie entiere en fonction <& 
la statistique des ecarts de frequence, on definit un certain nombre d'ecarts 

20 maximal entre deux frequences. 

Le codage de la dynamique des modules (bloc 64) utilise une Ioi de 
HUFFMAN en fonction du nombre de plages definissant ladite dynamique et 
du type de signal. Dans le cas d'un signal voise, renergie du signal se situe 
25 dans les basses frequences ; pour les autres types de signal, renergie est 
repartie uniformement dans le plan frequenfiel, avec une baisse vers les hautes 
frequences. 

Le codage du module le plus eleve (bloc 65) consiste & coder, suivant une loi 
30 de HUFFMAN, la partie entiere dudit module le plus eleve en tenant compte 
de la statistique dudit module le plus eleve. 
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Le codage des modules (bloc 66) n'est realise que si le nombre de module a 
coder est superieur a 1, etant donne que dans le cas contraire, il est seul en 
<5tant le module le plus eleve. 

5 Lors de l'analyse (bloc Al), la suppression du signal inaudible (bloc 25 du 
bloc Al) elimine les modules inferieurs au produit du module par 1' attenuation 
correspondante ; ainsi un module se situe obligatoirement dans une zone du 
plan module/frequence dependant de la distance qui le separe de ses deux 
modules adjacents en fonction de l'ecart de frequence desdits modules 

10 adjacents. Ainsi la valeur du module est approximee relativement au module 
precedent en fonction de l'ecart de frequence et de l'attenuation 
correspondante qui depend du type de signal, de la valeur de normalisation et 
du type de compression ; ladite approximation de la valeur du module est 
effectuee en reference a une echelle dont le pas varie suivant une loi 

15 logarithmique. 

Le codage de lWnuation (bloc 67) apportee par le filtre d'entree des 
echantillons est effectue, puis est suivi de la suppression de la normalisation 
(bloc 68) qui permet de recalculer le module le plus eleve ainsi que la 
20 frequence correspondante. 

Le codage des fractions frequentielles des frequences non harmoniques (bloc 
69) complete le codage des parties entieres desdites frequences. 
La precision du codage va dependre : 
25 o de la frequence : plus la frequence est faible, plus la precision sera 

&evee de maniere a ce que le rapport erreur de codage sur frequence 
soit faible, 
o du type de signal, 
© du type de compression, 
30 o de la valeur de normalisation du signal : plus l'intensite du signal est 

61evee, plus le codage est precis. 
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Enfin, le codage du nombre d' octets de codage (bloc 70) est effectue k Tissue 
du codage des differents paramcbtres susmentionnes, memorises dans une 
m&noire de codage dedi^e. 

5 

I/aboutissement de ladite phase de codage est reference par le bloc 71 . 

En reference k la figure 1 representarit un organigramme simplifie du precede 
selon Tinvention, dans cet exemple 5 la phase de decodage des param&res est 
10 representee par le bloc CI. 

Le decodage etant Tinverse du codage, T exploitation des bits de codage des 
differents parametres susmentionnes permettra de retrouver les valeurs 
d'origine des parametres, avec d^eventuelles approximations. 

15 En reference k la figure 1 representant un organigramme simplifie du procede 
selon Tinvention, dans cet exemple, la phase de filtrage du bruit et de 
generation d'effets speciaux, k partir de T analyse, sans passer par la synthese 
est indiqu£e par le bloc D. 

20 Le filtrage du bruit est effectue k partir des parametres de la: voix calcules dans 
T analyse (bloc Al du bloc A), empruntant le trajet IV.indique sur ledit 
organigramme simplifie du procede selon Tinvention. 

II s'av£re que les algorithmes connus de Tetat de Tart realisent une annulation 
25 du bruit k partir des proprietes statistiques du signal ; le bruit doit Stre par 
consequent stationnaire statisticjuement ; cette demarche n'autorise done pas la 
presence de bruit sous forme harmonique (voix, musique). 

L'objectif du filtrage du bruit est par consequent de reduire toutes sortes de 
30 bruit tel que : bruit ambiant de yoiture, de moteur, de foule, de musique, 
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d'autres voix si celles-ci sont plus faibles que celles a conserver, ainsi que Ies 
bruits de calcul de tout vocodeur (a titre d'exemple : ADPCM, GSM, G723). 

Par ailleurs, la majority des bruits ont leur Snergie dans les basses frequences ; 
5 le fait d'utiliser le signal de Panalyse pr6alablement filtre par le filtre d'entree 
des echantillons permet de diminuer d'autant le bruit tres basse frequence. 

Le filtrage du bruit (bloc D) pour un signal vois6 consiste k rSaliser la somme 
pour chaque echantillon, du signal original, du signal original d6cale de un 

10 « pitch » en valeur positive et du signal original decale de un « pitch » en 
valeur negative. Ceci necessite de connaitre pour chaque echantillon, la valeur 
du « pitch » et de sa variation. Avantageusement les deux signaux d^cates sont 
multiplies par un m6me coefficient, et le signal original non decale par un 
second coefficient ; la somme dudit premier coefficient rajoute a lui-m8me et 

15 dudit second coefficient est egale a 1, diminue de maniere a conserver un 
niveau equivalent du signal resultant. 

Par ailleurs, le filtrage du bruit ne conceme pas les signaux sous forme 
d'impulsion ; il est done necessaire de detecter la presence d'eventuelles 
impulsions dans le signal. 

20 

Le filtrage du bruit (bloc D) pour un signal non vois£ consiste a attenuer ledit 
signal par un coefficient infSrieure a 1 . 

Dans le domaine temporel, la somme des trois signaux sus mentionnSs est 
25 corr616e ; quant au bruit contenu dans le signal original, la somme att&iuera 
son niveau. 

Ainsi, il est necessaire de connaitre avec exactitude la variation du « pitch », 
e'est-a-dire la valeur temporelle du « pitch », approximSe en valeur lin^aire, 
30 sachant qu'elle fait intervenir un terme du second ordre ; 1 5 amelioration de la 
precision des deux susdits dScalages, positif et nSgatif, est obtenue grace & 
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l'utilisation de»la correlation par la distance en debut, milieu et fin de trame ; 
cette demarche a ete decrite au cours de l'etape "calcul des parametres du 
signal" (bloc 1 1 du bloc Al). 

Avantageusement, le filtrage de bruit, decrit precedemment, permet de generer 
des effets speciaux ; ladite generation d'effets speciaux permet d'obtenir : 

• une feminization de la voix, en divisant la valeur temporelle du 
« pitch » par deux, pour certaines valeurs des amplitudes du signal 
original et des signaux originaux decales ; ceci multiplie 
artificiellement la frequence du « pitch » de la voix par deux en. 
supprimant les harmoniques impaires ; 

• une voix artificielle et etrange, en divisant la valeur temporelle du 
« pitch » par deux, pour d'autres valeurs des amplitudes du signal 
original et des signaux originaux decales ; ceci permet de ne garder 
que les harmoniques impaires ; 

• deux voix differentes, en divisant la valeur temporelle du « pitch » 
par deux, pour differentes valeurs des amplitudes du signal original 
et des signaux originaux decales ; ceci permet d'attenuer les 
harmoniques impaires. 

Enfin, une autre demarche, semblable a celle decrite precedemment permettant 
le filtrage du bruit, pourra 8tre appliquee, non pas pour filtrer le bruit, mais 
pour diviser par deux ou par trois la fondamentale de la voix et ce, sans 
modification du formant (enveloppe spectrale) de ladite voix. 

Le principe de ladite demarche consiste : 

• a multiplier chaque echantillon de la voix originale par un cosinus 
variant au rythme de la moitie de la fondamentale (multiplication 
par deux du nombre de frequences), ou variant au rythme du tiers de 
la fondamentale (multiplication par trois du nombre de frequences), 

• puis a additionner le resultat obtenu a la voix originale. 
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Par ailleurs, la phase de filtrage du bruit et de generation d'effets speciaux, a 
partir de l'analyse, sans passer par la synthese, peut ne pas inclure le calcul de 
la variation du « pitch » ; ceci permet d'obtenir une qualite auditive voisine de 
celle precedemment obtenue selon le proc6de susmentionnd ; dans ce mode 
operatoire, les fonctions deiinies par les blocs 11, 12, 15, 16, 17, 18, 19, 25 et 
28 sont supprimees. 

En r6ference a la figure 1 representant un organigramme simplifie du procede 
selon 1' invention, dans cet exemple, la phase de generation d'effets spdciaux, 
associee a la synthese (bloc C3) est indiquee par le bloc C2 du bloc C. 
La dite phase de generation d'effets speciaux, associee a la synthese, permet 
de transformer la voix ou la musique : 

• soit en modifiant selon certaines lois, les parametres decodes issus 

du bloc CI (trajet II), 
® soit en traitant directement les resultats de l'analyse issus du bloc 
Al (trajet HI). 

Les parametres modifies sont : 
© le « pitch », 
o la variation du « pitch », 
o la validation du « pitch », 
q le nombre de composantes frequentielles, 
o les frequences, 
o les modules, 
o les indices. 

Les frequences etant distinctes entre el les, leur transfonnation permet de 
rajeunir la voix, de la vieillir, de la feminiser ou inversement, de la transformer 
en une voix artificielle. Ainsi la ti-ansformation des modules autorise toute 
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sorte de filtrages et permet en outre de conserver la voix naturelle en gardant 
le formant (enveloppe spectrale). 

A titre d'exemples, trois types de transformation de la voix seront decrits ci- 
5 apres, chacun etant reference sous une appellation qui lui est propre, a savoir : 

- la fonction "Transform" modifiant la voix de facon artiflcielle et 
permettant de creer un effet de chorale, 

- la fonction "Transvoice" modifiant la voix de fa9on realiste, 

- la fonction "Formant" associee a la fonction'Transvoice". 

10 .. 
La fonction "Transform", consiste a multiplier toutes les frequences des 
composantes frequentielles par un coefficient. Les modifications de la voix 
sont fonction de la valeur de ce coefficient, a savoir : 

• une valeur superieure a 1 transforme la voix en voix de canard, ^ ; 
15 • une valeur faiblement superieure a 1 rajeunit la voix, "> 

• une valeur inferieure a 1 rend la voix plus grave. '■ ' ? 

En effet, ce rendu artificiel de la voix est du au fait que les modules des 
composantes frequentielles sont inchanges et que 1' enveloppe spectrale est 
20 deibrmee. 

Par ailleurs, en synthetisant plusieurs fois les m6mes parametres, modifies par 
ladite fonction "Transform" avec un coefficient different, on realise un effet de 
chorale en donnant 1' impression que plusieurs voix sont presentes. 

25 La fonction "Transvoice" consiste a recreer les modules des harmoniques a 
partir de Penveloppe spectrale, les harmoniques originaux sont abandonnes 
sachant que les frequences non harmoniques ne sont pas modifiees ; a ce titre, 
ladite fonction "Transvoice" fait appel a la fonction "Formant" qui ddtermine 
le formant. 

30 Ainsi, la transformation de la voix est effectuee de facon realiste car le 
formant est conserve; un coefficient de multiplication des frequences 
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harmoniques superieure a 1 rajeunit la voix, voire la feminise ; 
reciproquement, un coefficient de multiplication des frequences harmoniques 
inferieure a 1 rend la voix plus grave- 
Par ailleurs, afin de conserver un niveau sonore constant, independamment de 
5 la valeur du coefficient de multiplication, les nouvelles amplitudes seront 
multipliees par le rapport de la somme des modules en entree de ladite 
fonction "Transvoice" a la somme des modules en sortie. 

La fonction "Formant" consiste a determiner l'enveloppe spectrale du signal 
10 fr6quentiel ; elle est exploitee pour garder les modules des composantes 
frequentielles constants quand les frequences sont modifiees. 
La determination de l'enveloppe est effectuee en deux etapes, a savoir : 
® un filtrage des modules places dans l'enveloppe, 
• une interpolation logarithmique de l'enveloppe entre deux modules 
15 d'un harmonique. 

Ladite fonction "Formant" peut etre appliquee lors du codage des modules, des 
frequences, des plages d'amplitudes et des fractions de frequences, en 
n'effectuant le dit codage que sur les parametres essentiels du formant, le 
20 « pitch » etant valid6. Dans ce cas, lors du decodage, les frequences et les 
modules sont recalcules a partir respectivement du « pitch » et de l'enveloppe 
spectrale. Ainsi le d6bit binaire est reduit ; neanmoins, cette demarche n'est 
applicable qu'a la voix. 

25 Les dites fonctions "Transform" et "Transvoice", decrites pr6cedemment font 
intervenir un coefficient de multiplication des frequences constant Cette 
transformation peut etre non lineaire et permettre de rendre la voix artificielle. 

En effet, si ce coefficient de multiplication est fonction du rapport entre le 
30 nouveau « pitch » et le « pitch » r6el, la voix sera caracterisee par un « pitch » 
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fixe et un formant variable ; elle sera ainsi transformed en voix de robot 
associee a un effet spatial. 

Si ce coefficient de multiplication varie periodiquement ou aleatoirement, a 
basse frequence, la voix est vieillie associee a un effet hilarant. 

Ces differentes transformations de la voix, obtenues a partir d'une 
modification, constante ou variable dans le temps, des frequences, ladite 
modification 6tant effectuee sur chacune des frequences prises separement, 
sont donnees a titre d'exemples. 

Afin de permettre la mise en oeuvre du proc6d<§ selon Pinvention, un dispositif 
sera decrit ci-apres, avec reference a la figure 5. 

Le dispositif, selon Pinvention, comprend essentiellement : 

• un calculateur 71, de type DSP, permettant d'effectuer le traitement 
numerique des signaux, 

• un clavier 72 permettant de selectionner les menus de traitement de 
la voix, 

• une m^moire morte 73, de type EEPROM, contenant le logiciel de 
traitement de la voix, 

® une memoire vive 74, de type flash ou « memory stick », contenant 
les enregistrements de la voix traitee, 

• un afficheur 75, de type LCD, assocte au clavier 72, indiquant les 
differents menus de traitement de la voix, 

• un codeur/decodeur 76^ de type codec, assurant les liaisons 
entree/sortie des p6riph6riques audio, 

• un micro 77, de type electret, 
© un haut-parleur 78, 

• une batterie 79, 
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© une liaison entree/sortie 80, permettant le transfert des 
enregistrements numeriques et les mises a jour du logiciel de 
traitement de la voix. 

Par ailleurs, le dispositif pourra comporter : 

© un connecteur t616phonique permettant au dispositif selon 

T invention de se substituer & un combinS t61ephonique, 
© un connecteur de tetephonie mobile, 
© une sortie casque, permettant Pecoute des enregistrements, 
© une sortie chaine hi fi, permettant la fonction karaoke, 
© un connecteur d'alimentation externe. 

D'une maniere plus pr6cise, le dispositif pourra comporter : 

- des moyens d' analyse permettant de determiner des parametres 
representatifs dudit signal sonore, les susdits moyens d'analyse 
comprenant : 

© des moyens de calcul de Penveloppe du signal, 
© des moyens de calcul du « pitch « et de sa variation, 
a des moyens d' application au signal temporel de la variation inverse 
du «pitch», 

© des moyens de transform^ rapide de Fourrier (TRP) sur le signal 
pr&raite, 

© des moyens d'extraction des composantes ftequentielles et leurs 
amplitudes dudit signal, a partir du resultat de la transform^ rapide 
de Fourrier, 

o des moyens d'elimination eventuelle du bruit ambiant par filtrage 
s^lectif avant codage, 

- des moyens de synthase desdits paramfctres repr6sentatifs permettant de 
reconstituer ledit signal sonore, les susdits moyens de synthese 
comprenant : 
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o des moyens de sommation des sinus dont F amplitude des 
composantes frequentielles varie en fonction de Fenveloppe du 
signal, 

• des moyens de calcul des phases en fonction de la valeur des 
frequences et des valeurs des j>hases et des frequences appartenant & 
la trame precedente, 

• des moyens de superposition du bruit, 

• des moyens duplication de Penveloppej 

des moyens de filtrage du bruit et de generation d'effets speciaux, k partir 
de F analyse, sans passer par la synthase, les susdits moyens de filtrage du 
bruit et de generation d'effets speciaux comprenant : 

• des moyens de sommation du signal original, du signal original 
decale de un « pitch » en valeur positive et du signal original decal£ s 
de un « pitch » en valeur negative, i: 

• des moyens de division de la valeur temporelle du . « pitch » par : 
deux, o? 

• des moyens de modification des amplitudes du signal original et des 
deux signaux decaies, 

© des moyens de multiplication de chaque echantillon de la voix 
originate par un cosinus variant au rythme de la moitie de la 
fondamentale (multiplication par deux du nombre de frequences), ou 
variant au rythme du tiers de la fondamentale (multiplication par 
trpis du nombre de frequences), 

• des moyens d' addition ensuite du resultat bbtenu a la voix originale, 

des moyens de generation d'effets speciaux associes a la synthese, les 
susdits moyens de generation d'effets speciaux comprenant : 

© des moyens de multiplication de toutes les frequences des 

composantes frequentielles du signal original, prises 

individuellement, par un coefficient, 
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© des moyens de r6g6n6ration des modules des harmoniques k partir 
de l'enveloppe spectrale dudit signal original. 

Avantageusement, le dispositif pourra comporter tous les elements cit6s 
5 prec^demment, en version professionnelle ou semi professionnelle ; certains 
Elements, tel que Pafficheur, pourront §tre simplifies en version de base. 

Ainsi, le dispositif selon T invention, decrit ci-dessus, pourra exploiter le 
proc6d6 de traitement num&ique differencie de la voix et de la musique, de 
10 filtrage du bruit et la creation d'effets speciaux. 

II permettra notamment de transformer la voix : 
® en une autre voix r6aliste, 
• pour un usage de type karaoke, 
15 © en une autre voix futuriste, etrange, d'accompagnement 

II permettra 6galement : 

© de supprimer le bruit ambiant et d'augmenter les capacites 
d' enregistrement, 

20 o de transferer les enregistrements sur disque dur d'ordinateur et de 

les reecouter a vitesse variable, 
© de r6aliser une fonction « main libre » assoctee a un radiotelephone 
mobile. 

o de gen£rer une r6ponse auditive adaptee aux mal entendants. 
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Revendications 



1- Procede pour le traitement numerique differencie d'un signal sonore, 
constitue dans Pintervalle d'une trame par la somme de sinus d'amplitude fixe 

5 et dont la frequence est modulee lineairenient en. fonction du temps, cette 
somme etant modulee temporellement par tme enveloppe, le bruit dudit signal 
sonore etant rajoute audit signal, pr^alablement & ladite somme, 
caracterise en ce qu'il comprend : 

une etape d'analyse permettant de determiner des paramdtres representatifs 
10 dudit signal sonore, par 

• un calcul de P enveloppe du signal, 

• un calcul de la periode du fondamental du signal de voix (« pitch «) et de 
sa variation, 

• une application au signal temporel de la variation inverse du «pitch», 
15 • une transformee rapide de Fourrier (TRF) sur le signal pretraite, 

• une extraction des composantes jQrdquentielles et leurs amplitudes dudit 
signal, k partir du r^sultat de la transformee rapide de Fourrier, 

• une elimination eventuelle du bruit ambiant par filtrage seiectif avant - 
codage. 

20 

2- Procede selon la revendication 1, 

caracterise en ce qu'il comprend en outre une etape de synthese desdits 
parametres representatifs permettant de reconstituer ledit signal sonore. 

25 3- Proc6d6 selon les revendications precedentes, 

caracterise en ce qu'il comprend en outre une etape de codage et de decodage 
desdits parametres representatifs dudit signal sonore. 
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4- Procede selon les revendications precedentes, 
caracterise en ce qu'il comprend en outre une etape de filtrage du bruit et une 
etape de generation d' effete speciaux, a partir de Panalyse, sans passer par la 
synthese. 

5- Procede selon les revendications precedentes, 
caracterise en ce qu'il comprend en outre une etape de generation d'effets 
speciaux associ6s a la synthese. 

6- Proced6 selon la revendication 2, 
caracterise en ce que la susdite etape de synthese comprend : 

o une sommation des sinus dont ^amplitude des composantes 
fr6quentielles varie en fonction de Penveloppe du signal et dont les 
frequences varient lineairement, 
© un calcul des phases en fonction de la valeur des frequences et des 
valeurs des phases et des frequences appartenant a la triame 
precedente, 
0 une superposition du bruit, 
o une application de Penveloppe. 

7- Procede selon la revendication 4, 
caracterise en ce que la susdite etape de filtrage du bruit et la susdite etape de 
generation d'effets speciaux, k partir de V analyse, sans passer par la synthese, 
comprennent une somme du signal original, du signal original decaie de un 
« pitch » en valeur positive et du signal original decaie de un « pitch » en 
valeur negative. 

8- Procede selon la revendication 7, 
caracterise en ce que les susdits signaux decales sont multiplies par un mdme 

30 coefficient, et le signal original par un second coefficient, la somme dudit 
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premier coefficient, rajoute a lui-meme, et dudit second coefficient est egale a 
1, diminu6 de maniere a conserver un niveau equivalent du signal resultant. 

9- Proc6de selon la revendication 7, 

caracterise en ce que la susdite .etape de filtrage et la susdite etape de 
generation d'effets speciaux, a partir de l'analyse, sans passer par la synthese, 
comprennent : 

• une division de la valeur temporelle dii « pitch » par deux, 

• une modification des amplitudes du signal original et des deux 
signaux decal6s. 

10- Proc&ie selon la revendication 7, 

caracterise en ce que la susdite etape de filtrage et la susdite etape de 
generation d'effets speciaux, a partir de l'analyse, sans passer par la synthese, 
comprennent : 

• une multiplication de chaque echantillon de la voix originate par un 
cosinus variant au rythme de la moitie de la fondamentale 
(multiplication par deux du nombre de frequences), ou variant au . 
rythme du tiers de la fondamentale (multiplication par trois du 
nombre de frequences), 

• une addition ensuite du resultat obtenu a la voix originale. 

1 1- Proc6d6 selon la revendication 5, 

caracterise en ce que la susdite etape de generation d'effets speciaux associes a 
la synthase, comprend : 

• une multiplication de toutes les frequences des composantes 
frequentielles du signal original, prises individuellement, par un 
coefficient, 

«> une regeneration des modules des harmoniques a partir de 
l'enveloppe spectrale dudit signal original. 
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12- Procede selon la revendication 1 1, 

caracterise en ce que le susdit coefficient de multiplication des composantes 
frequentielles est : 

© un coefficient fonction du rapport entre le nouveau « pitch » et le 
5 « pitch » r£el, 

o un coefficient variant, p6riodiquement ou aleatoirement, a basse 
frequence. 

13- Dispositif selon la revendication 1 de traitement numerique 
10 differencie d'un signal sonore, constitue dans l'intervalle d'une trame par la 

somme de sinus d' amplitude fixe et dont la frequence est modulee 
lineairement en fonction du temps, cette somme etant moduiee temporellement 
par une enveloppe, le bruit dudit signal sonore etant rajoute audit signal, 
prealablement a ladite somme, 
1 5 caracterise en ce qu'il comprend : 

- des moyens d'analyse permettant de determiner des parametres 
representatifs dudit signal sonore, et/ou 

- des moyens de synthese desdits parametres representatifs permettant de 
reconstituer ledit signal sonore, et/ou 

20 - des moyens de codage et de decodage desdits parametres representatifs 
dudit signal sonore, et/ou 

- des moyens de filtrage du bruit et de generation d'effets speciaux, a partir 
de F analyse, sans passer par la synthese, et/ou 

- des moyens de generation d'effets speciaux associes h la synthese. 

25 

14- Dispositif selon la revendication 13, 
caracterise en ce que les susdits moyens d'analyse comprennent : 
© des moyens de calcul de l'enveloppe du signal, 
o des moyens de calcul du « pitch « et de sa variation, 
30 o des moyens d'application au signal temporel de la variation inverse 

du <q)itch», 
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• des moyens de transform^ rapide de Fourrier (TRF) sur le signal 
pretrait6, 

• des moyens d'extraction des composantes frequentielles et leurs 
amplitudes dudit signal, a partir du resultat de la transform6e rapide 
de Fourrier, 

• des moyens d'elimination eventuelle du bruit ambiant par filtrage 
selectif avant codage. 

15- Dispositif selon larevendication 13, 

caractSrise" en ce que les susdits moyens de synthese comprennent : 

• des moyens de sommation des sinus dont Pamplitude des 
composantes frequentielles varie en fonction de Penveloppe du 
signal, 

• des moyens de calcul des phases en fonction de la valeur des 
frequences et des valeurs des phases et des frequences appartenant a'« 
la trame prec^dente, 

• des moyens de superposition du bruit, 

• des moyens duplication de Penveloppe. . 

16- Dispositif selon la revendication 13, 

caracterise en ce que les susdits moyens de filtrage du bruit et de generation 
d'effets speciaux, a partir de l'analyse, sans passer par la synthese, 
comprennent des moyens de sommation du signal original, du signal original 
decale de un « pitch » en valeur positive et du signal original decale de un 
« pitch » en valeur negative. 

17- Dispositif selon la revendication 16, 

caracterise en ce que les susdits signaux decales sont multiplies par un meme 
coefficient, et le signal original par un second coefficient, la somme dudit 
premier coefficient, rajoute a lui-meme, et dudit second coefficient est egale a 
1, diminud de manidre a conserver un niveau equivalent du signal resultant. 
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18- Dispositif selon la revendication 13, 

caract6ris6 en ce que les susdits moyens de flltrage et de generation d'effets 
speciaux, a partir de l'analyse, sans passer par la synthese, comprennent : 

© des moyens de division de la valeur temporelle du « pitch » par 
deux, 

© des moyens de modification des amplitudes du signal original et des 
deux signaux d6cal6s. 

19- Dispositif selon la revendication 13, 

caract£ris6 en ce que les susdits moyens de filtrage et de g6n6ration d'effets 
speciaux, a partir de l'analyse, sans passer par la synthase, comprennent : 

o des moyens de multiplication de chaque echantillon de la voix 
originale par un cosinus variant au rythme de la moitie de la 
fondamentale (multiplication par deux du nombre de frequences), ou 
variant au rythme du tiers de la fondamentale (multiplication par 
trois du nombre de frequences), 
o des moyens d' addition ensuite du resultat obtenu a la voix originale. 

20- Dispositif selon la revendication 13, 

caractSrise en ce que les susdits moyens de g6n6ration d'effets speciaux 
associes a la synthese, comprennent : 

o des moyens de multiplication de toutes les frequences des 
composantes frequentielles du signal original, prises 
individuellement, par un coefficient, 
o des moyens de r6g6n6ration des modules des harmoniques a partir 
de Penveloppe spectrale dudit signal original. 
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21- Dispositif selon la revendication 20, 

caract&ise en ce que le susdit coefficient de multiplication des composantes 
firequentielles est : 

* un coefficient fonction du rapport entre le nouveau « pitch » et le 
« pitch » r6el, 

• un coefficient variant p&iodiquement, h basse frequence. 
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